Palabras

Los buscadores tratan cada documentos de Internet como una secuencia de palabras.
Una palabra en este contexto significa cualquier cadena de dígitos alfabéticos delimitada por algún signo de puntuación u otro carácter no alfabético (por ejemplo: &, %, $, /, #, _, ~), o por un espacio (espacio, tabulador, fin de línea, principio o fin del documento).
Una palabra no tiene porqué ser pronunciable o pertenener a algún diccionario.
Muchas palabras no son significantes para realizar búsquedas debido a su gran número de apariciones en muchos documentos.
Otras palabras si siquiera son indexadas por los buscadores como los signos de puntuación, los espacios en blanco y los artículos.